This Page Is Inserted by IFW Operations 
and is not a part of the Official Record 

BEST AVAILABLE IMAGES 



Defective images within this document are accurate representations of 
the original documents submitted by the applicant. 

Defects in the images may include (but are not limited to): 



BLACK BORDERS 

TEXT CUT OFF AT TOP, BOTTOM OR SIDES 
FADED TEXT 

ILLEGIBLE TEXT 
SKEWED/SLANTED IMAGES 
COLORED PHOTOS 

BLACK OR VERY BLACK AND WHITE DARK PHOTOS 
GRAY SCALE DOCUMENTS 



IMAGES ARE BEST AVAILABLE COPY. 

As rescanning documents mil not correct images, 
please do not report the images to the 
Image Problem Mailbox. 



THIS PAGE BLANK lusPTO) 



TM^nr WELTORGANISATTON FOR GEISTIGES EIGENTUM 

A \^ X Internationales BQro 

INTERNATIONALE ANMELDUNG VEROFFENTLICHT NACH DEM VERTRAG OBER DIE 

INTERNATIONALE ZUSAMMEN ARBEIT AUF DEM GEBIET DES PATENTWESENS (PCT) 



(51) Internatioiiaie PatentklassUkadon 6 : 

C12N 15/12, C07K 14/47, 16/18, C12N 
15/11, G01N 33/50, A01K 67/00, C12N 
1/21, 5/10 



A2 



(11) Internationale Veroffenttictaungsnnnimer: WO 96/35784 

14. November 1996 (14.1 1.96) 



(43) Internationales 

VerofTentlichungsdatimi: 



(21) Interna donates Aktenzeichen: 

(22) Internationales Anmeldedatum: 



PCT/EP96701818 
2. Mai 1996 (02.05.96) 



(30) Prioritatsdaten: 

195 16 776.7 



10. Mai 1995 (10.05.95) 



DE 



(71) Anmelder (fur alle Bestmmungsstaaten ausser US): 

BOEHRINOER INGELHEIM INTERNATIONAL 
GMBH [DE/DE]; Postfach 200, D-55216 Ingelheira am 
Rhein (DE). 

(72) Erflnder; und 

(75) Erfinder/Anmelder (nur fir US): JENUWEIN, Thomas 
[DE/AT]; Barichgasse 21/27, A-1030 Wien (AT). LAIBLE, 
G6tz [DE/AT]; Costagasse 9/13, A-l 150 Wien (AT). 

(74) Gemeinsamer Vertreter: BOEHRINGER INGELHEIM IN- 
TERNATIONAL GMBH; Postfach 200, D-55216 Ingelheim 
am Rhein (DE). 



(81) Bestimmungsstaaten: CA, JP, MX, US, europaisches Patent 
(AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE. IT, LU, 
MC, NL, PT. SE). 



Veroffentiicht 

Ohne intemationalen Recherchcnbericht und erneui zw 
vertiffentlichen nach Erhait des Berichts. 



(54) Title: CHROMATTN-REGULATOR GENES 
(54) Bezdchnung: CHROMATIN-REGULATORGENE 
(57) Abstract 

Hie invention concerns the deregulation of chromatin-regulator genes which have an SET domain, such deregulation being of 
importance in certain cancer conditions. These genes, in particular the SET domains as such, can be used in the diagnosis and therapy of 
such conditions. 

(57) Zusammenfassung 
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Chroma t in -Regul at orgene 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der strukturellen und f unktionellen 
Regulation von Chromatin spielen, und ihre Verwendung 
fur die Therapie und Diagnostik. 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in eu- und 
heterochromatische Regionen stellt einen entscheidenden 
Mechanismus zur Gewahrlei stung der genauen Replikation 
und Verteilung der genetischen Information bei jeder 
Zellteilung dar. Im Gegensatz dazu sind Tumorzellen 
haufig durch chromosomale Rearrangements, 
Trans 1 oka tionen und Aneuploidie charakterisiert 
(Solomon et al., 1991; Pardue, 1991). Obwohl die 
Mechanismen, die zu einer erhohten 

Chromosomeninstabilitat in Tumorzellen fuhren, noch 
nicht geklart sind, haben es in jiingster Zeit eine 
Reihe von experirnentellen Systemen, beginnend mit 
telomerischen Positionsef f ekten in Hefe (Renauld et 
al., 1993; Buck und Shore, 1995; Allshire et al., 

1994) , iiber Positionsef fekt- Variegation (PEV) in 
Drosophila (Reuter und Spierer, 1992), bis zur Analyse 
von Translokationsbruchpunkten in humanen Leukaraien 
(Solomon et al., 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identif izieren, die an 
der deregulierten Proliferation ursachlich beteiligt 
sind. 

Erstens wurde f estgestellt, dafi die Uberexpression 
einer verkurzten Version des SIR4-Proteins zu einer 
verlangerten Lebensdauer in Hefe f uhrt (Kennedy et al . , 

1995) . Da SIR-Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
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Telomer beitragen, konnte es sein, daE uberexprimiertes 
SIR4 mit diesen heterochromatinartigen Komplexen 
interferiert, was schlieSlich zu einer unkontrollierten 
Proliferation fuhrt. Diese Annahme steht im Einklang 
mit der Haufigkeit des Auftretens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter et al. # 1992). 

Zweitens wurden mittels genetischer Analysen von PEV- in 
Drosophila eine Reihe von Gehprodukten identif izi'ert , 
die die Chromatinstruktur an heterochromatischen 
Positionen und innerhalb des homeotischen Genclusters 
verSndern (Reuter und Spierer, 1992) . Mutationen 
einiger dieser Gene, wie modulo (Garzino et al., 1992) 
und polyhomeotic (Smouse und Perrimon, 1990), konnen in 
Drosophila die deregulierte Zellprolif eration Oder den 
Zelltod verursachen. Drittens wurden SSugetierhomologe 
von sowohl Aktivatoren (tri thorax oder trx-Gruppe) als 
auch Repressoren (z.B. polycomb oder Pc-Gruppe) der 
Chromatinstruktur von homeotischen Drosophila- 
Selektorgenen beschrieben. Unter diesen hat sich vom 
humanen HRX/ALL-1 (trx-Gruppe) gezeigt, dafi es an der 
durch Translokation induzierten Leukamogenese beteiligt 
ist (Tkachuk et al., 1992; Gu et al., 1992), und da£ 
die Uberexpression des Maus-Jbmi (Pc-Gruppe) zum 
Entstehen von Lymphomen fiihrt (Haupt et al . , 1991; 
Brunk et al., 1991; Alkema et al., 1995). Bin Modell 
fur die Funktion chromosomaler Proteine la£t darauf 
schliefien, daS diese raultimere Komplexe bilden, welche 
in Abhangigkeit von der Ausgewogenheit zwischen 
Aktivatoren und Repressoren im Komplex den 
Kondensationsgrad der umliegenden Chroma tinregion 
bestimmen (Locke et al., 1988). Eine Verschiebung 
dieses Gleichgewichts durch Oberexpression einer der 
Koraponenten des Koraplexes zeigte eine Neuverteilung von 
eu- und heterochromatischen Regionen (Buck und Shore, 
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1995; Reuter und Spierer, 1992; Eissenberg et al . , 
1992) . Dieser Dosiseffekt kann die Chromatinstruktur an 
vorbestimmten Loci destabilisieren, was letztlich zu 
einem Ubergang vom normalen zum transformierten Zustand 
fuhrt. 

Trotz der Charakterisierung von HRX/ALL-1 und bmi als 
Protoonkogene, die die Chromatinstruktur ver&ndern 
konnen, ist das Wissen fiber Saugetiergenprodukte, 
welche mit Chromatin wechselwirken, noch sehr 
beschrankt. Irn Gegensatz dazu wurden durch genetische 
Analysen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spierer, 
1992) . Kiirzlich wurde eine carboxyterminale Region mit 
Ahnlichkeit in der Sequenz identif iziert , die einem 
posit iven (£rx, trx-Gruppe) und einem negativen (E(z) , 
Pc-Gruppe) Drosophila-Chromatinregulator (Jones und 
Gelbart, 1993) gemeinsam ist. Daruberhinaus ist dieser 
Carboxyterminus auch in £u(var)3-9, einem dominanten 
Supressor der Chromat invert ei lung in Drosophila, 
konserviert (Tschiersch et al . , 1994) -. 

Bei der vorliegenden Erf indung wurde von der Uberlegung 
ausgegangen, daS diese als "SET" bezeichnete 
Proteihdotnane (Tschiersch et al., 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein in 
antagonistischen Genprodukten eine neue Genfamilie 
entwicklungsgeschichtlich wichtiger Saugetier- . 
Chromatinregulatoren definiert. Daruberhinaus tragt die 
Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufklarung der 
Mechanismen bei, die dafur verantwortlich sind, daS 
strukturelle VerSnderungen im Chromatin zur malignen 
Transformation fuhren konnen. 
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Der vorliegenden Erf indung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu 
identifizieren, ihre Funktion aufzuklaren und sie fur 
die Diagnostik und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die 
Sequenz information der SET-Domane benutzt, urn aus 
humanen cDNA-Banken die zu den SET-Domane-Genen von 
Drosophila homologen humanen cDNAs zu erhalten. Es 
wurden zwei cDNAs erhalten, die Humanhomologe von E(z) 
bzw. Su(var)3-9 darstellen; . die entsprechenden humanen 
Gene wurden ale EZH2 und SUV39H bezeichnet (vgl.- 
unten) ; aufierdem wurde eine variante Form von EZH2 
identifiziert , die als EZH1 bezeichnet wurde. 

Die vorliegende Erf indung betrifft somit DNA-Molekule , 
enthaltend eine fur ein Chromatinregulator-Protein, das 
eine SET-Domane aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , daS sie die 
in Fig. S oder in Fig. 7 dargestellte Nukleotidsequenz 
aufweisen. Die erf indungsgemafien DNA-Molekule werden im 
folgenden auch als "erf indungsgemafie Gene" bezeichnet. 

Die erfindungsgemaSen Gene tragen die Bezeichnung EZH2 
und SUV39K, sie wurden ursprunglich als "HEZ-2" und 
"H3-9." bezeichnet. 

Die Erf indung betrifft in einera weiteren Aspekt die von 
diesen Genen abgeleiteten cDNAs, einschlieSlich ihrer 
degenerierten Varicmten; Mutanten, die fur funktionelle 
Chromatinregulatoren kodieren sowie Varianten, die auf 
eine Genduplikation zuruckzufuhren sind; ein Beispiel 
dafur ist EZH1, dessen Teilsequenz im Vergleich mit 
EZH2 in Fig. 8 dargestellt ist. 
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Zur Losung der im Rahmen der vorliegenden Erf indung 
gestellten Aufgabe wurde im einzelnen wie folgt 
vorgegangen: Ausgehend von der Sequenz information von 
der konservierten SET-Domane, wurde unter reduzierter 
Stringenz eine humane B-Zell-spezif ische cDNA- 
Bibliothek mit einer gemischten Drosophila-DNA- Sonde, 
die fur die SET-Domanen von E (z) und Su(var}3-9 
kodiert, gescreent- Aus 500.000 Plaques wurden 40 
primSre Phagen ausgewahlt. Nach zwei weiteren Runden 
Screening zeigte sich, daS 31 Phagen fur authentische 
E(z) -Sequenzen kodieren und daS ffinf Phagen E[z)- 
Varianten darstellen. Im Gegensatz dazu hybridisierten 
nur zwei Phagen mit der Sonde, die die SET-Domane von 
Su(var)3-9 allein enthielt. Die Phageninserts wurden 
mittels Polymerasekettenreaktion (PGR) amplifiziert und 
mittels Restriktionskartierung und Teilsequenzierung 
analysiert. Representative cDNA- Inserts wurden 
subkloniert und fiber ihre ganze Lange sequenziert* Die 
S'-Enden wurden isoliert, indem positive Phagen. noch 
einmal mit 5 ! -DNA-Sonden gescreent wurden, worauf nach 
Subklonierung komplette cDNAs erhalten wurden. 

Die komplette, fur das humane Homologe von E{z) 
kodierende cDNA wurde als EZH2 und die DNA, die fur das 
humane Homologe von Su(var)3-9 kodiert, wurde als 
SUV39H bezeichnet. Insgesamt betragt die Identitat der 
Aminosauren zwischen Drosophila und den humanen 
Proteinen 61 % fur EZH2 und 43 :% fur SUV39H, wobei die 
C-terminale SET-Domane sehr hoch konserviert ist 
(88 % fur EZH2 und 53 % fur SUV39H) . Der 
Sequenzvergleich zeigte weitere deutliche 
Homologieregionen, z.B. eine Cystein-reiche Domane in 
EZH2 und eine Chromo-Box in SUV39H. (In polycomb wurde 
gezeigt, dafi die Chromo-Box die ffir die Wechselwirkung 
zwischen DNA und Chromatin wesentliche Domane ist; 
Messmer et al., 1992} . Im Gegensatz dazu fehlen die. 
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207 Aminosauren, die das aminoterminale GTP- 
Bindungsmotiv des Drosophi la-Proteins enthalten, im 
humanen Homologen SUV39H. 

Der Vergleich der Aminosaure-Sequenzen zwischen den 
Drosophila- und den humanen Genen ist in den Fig. 1 
und 2 dargestellt: 

Fig. 1 zeigt den Vergleich der Aminosaure-Sequenz 
zwischen EZH2 und von Drosophila Enhancer von zeste 
(E(z)) . Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Cys-reichen Region (Cys-Reste sind hervorgehoben) sind 
gezeigt. Die mutmalSlichen Kernlokalisierungssignale 
sind unterstrichen . 

Fig. 2 zeigt den Vergleich der Aminosaure-Sequenz 
zwischen dem humanen Homologen SUV39H und Drosophila 
Su(var)3-9. Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Chromo-Domane (dunkler schattierte Box) sind 
dargestellt. Die mutmaSlichen Kernlokalisierungssignale 
sind unterstrichen. Oben in der Figur ist eine 
schematische Ubersicht der beiden Proteinstrukturen 
dargestellt, die zeigt, daS im humanen Homologen 
207 Aminosauren am N-Terminus fehlen. 

Da translationale Consensus sequenzen in Umgebung des 
Start -ATG der humanen SOV35H-CDNA auch an der 
entsprechenden internen Position in Su(var)3-9 
vorhanden sind, durfte das Drosophila- Protein 
zusatzliche Exons enthalten, die in einera spateren 
Stadium der Evolution fur die Funktion entbehrlich 
wurden. (Die Richtigkeit dieser Hypothese kann 
bestatigt werden, indem die humane SE7V3SH-CDNA und 
komplette oder am 5 1 -Ende verkurzte cDNAs von 
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Su(var) 3-9 in Drosophila exprimiert werden. 
Daruberhinaus wurde eine weitere cDNA der Bezeichnung 
MG-44 beschrieben 

(s. unten) , der ebenfalls das 5"-Ende des Drosophila- 
Gens fehlt.) Zusatzlich zur humanen cDNA von SUV39H 
wurde auch der homologe Locus in der Maus (Suv3 9h; 
siehe unten) isoliert, dessen Sequenzanalyse und 
Promotorstruktur eindeutig die aminoterminale 
VerkiLirzung saugerhomologer Gene im Vergleich zu 
Drosophila Su(var) 3-9 bestatigt. 

Im Rahmen der vorliegenden Erfindung durchgef iihrte DNA- 
Blot-Analysen deuten darauf hin, da£ saugerhomologe 
Gene von Su(var) 3-9 in der Maus und im Menschen von 
einzelnen Loci represent iert werden, wahrend 
saugerhomologe Gene von E(z) in der Maus und im 
Menschen durch zwei getrennte Loci kodiert sind. Der 
zweite humane Locus (als EZH1 bezeichnet) wurde auch 
durch Charakterisierung einer kleinen Anzahl von cDNA- 
Varianten, die sich in ihren 3 1 -f lankierenden Sequenzen 
von der Mehrzahl der aus der humanen cDNA-Bibliothek 
isolierten Klone unterscheiden, bestatigt. Die 
Unterschiede zwischen EZH2 und EZH1 im sequenzierten 
Bereich sind in Fig, 8 dargestellt: Die SET-Domane von 
EZH1 zeigt gegenuber EZH2 Mutationen; auSerdem tragt 
die von uns isolierte EZH1 -Variante (sehr 
wahrscheinlich eine aberrant gespleifite cDNA) ein sich 
im Leserahmen befindliches Stopcodon/* welches das 
Protein urn die 47 C-terminalen Aminosauren verkiirzt. In 
Fig. 8 ist die Nukleotidsequenz der EZH2-cDNA von 
Position 1844 bis 2330 in der jeweils oberen Zeile 
dargestellt, wobei die 5 1 SpleiSstelle und das 
potentielle Stopcodon unterstrichen sind. Urn eine 
Teilsequenz der cDNA der EZH1 -Variante der KZH2-Sequenz 
zuzuordnen, wurde das gap-Programm des Wisconsin GCG 
Netzwerkservice verwendet. Das vorzeitige Stopcodon in 
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EZH1 (Position 353) ist unterstrichen. Sequenzen, die 
fur die konservierte SET-Domane kodieren, sind 
hervorgehoben. AuBerdem ist das 3 ' -Ende (Position 151 
in EZH1) des aberranten Transkripts B52 (s. unten) 
dargestellt . Uber die verf ugbare Sequenz zeigte sich 
B52 zu 97 % identisch mit EZH1 und zu 72 % identisch 
rnit EZH2. Der Sequenzvergleich von EZH1 mit EZH2 sowie 
die Feststellung, dafi beirn Menschen und der Maus zwei 
getrennte E(z) -homologe Loci auftreten, lassen darauf 
schliefien, daS bei Saugern eine Genduplikation 
aufgetreten ist. 

In einem Vergleich mit cDNA- Sequenzen in der Datenbank 
GeneBank wurde uberraschend f estgestellt , daS bestimmte 
in der Datenbank eingetragene cDNA-Teilsequenzen, die 
von aberranten Transkripten in Tumorgeweben abgeleitet 
sind, mutierte Versionen der erf indungsgemaSen cDNAs 
darstellen: 

Einerseits war auf der Suche nach BRCA1, einem Gen, das 
fflr Brust- und Eileiterkrebs prSdisponiert , eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der 
Bezeichnung B52, die fur eine mutierte Variante der 
SET-Domane kodiert, isoliert und auf dem humanen 
Chromosom 17q21 kartiert worden (Friedman et al«, 
1994) . Es wurde im Rahmen der vorliegenden Erfindung 
Oberraschend f estgestellt , dafi B52 97 % IdentitSt mit 
der erf indungsgemaSen EZffl-cDNA- Variant e aufweist (vgl. 
oben) ; m6glicherweise stellt EZH1 ein Gen dar, dessen 
Reaktivierung bei der deregulierten Proliferation eine 
Rolle spielt. 

Andererseits war eine cDNA (2.800 Nukleotide; MG-44) 
vom humanen Chromosom Xpll isoliert worden (Geraghty 
et al., 1993), einer Region, die filr degenerative 
Storungen der Netzhaut und Synovialsarkome 
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pradisponiert . Es wurde iiberraschend f estgestellt , daS 
diese cDNA 98 % Identitat mit der erf indungsgemafien 
SUV39H-CDWA aufweist. 

Die im Rahmen der vorliegenden Erfindung 
bereitgestellten neuen Gene ermoglichen es somit, einen 
Zusammenhang zwischen bestimmten Krebserkrankungen und 
Mutationen in Chromatinregulatoren herzuleiten; im 
Falle der M?-44-cDNA konnte, da diese mehrere Punkt- 
und Frameshift -Mutationen aufweist, welche die Chromo- 
und SET-Pomanen unterbrechen, erst anhand der 
erfindungsgemaSen 

SUV3 9H- cDNA ein Zusammenhang zwischen 3u( var) 3-9 und 
MG-44 aufgeklart werden. 

Neben den bereits genannten Sequenzen sind in der 
Sequenzdatenbank GeneBank als weitere humane Mitglieder 
der SET-Proteinfamilie das gut dokumentierte humane 
Homologe von Drosophila trx, HRX/ALL-1 (Tkachuk et al., 
1992; Gu et al., 1992) eingetragen, ferner ein Gen 
unbekarmter Funktion der Bezeichnung G9a, das im 
humanen Major Histocompatibility Complex (Milner und 
Campbell, 1993) vorhanden ist, drittens eine nicht 
publizierte cDNA {KG-D , die aus unreif en myeloiden 
Tumorzellen isoliert. wurde (Nomura et al., 1994). 
Wahrend G9a derzeit das einzige . humane Gen mit einer 
SET-DontcLne ist, fur das bisher keine mutierte Version 
bekannt ,ist,. tragt KG-1 eine Insertion von 342 
Aminosaiiren, welche die SET-Domane in eine Amino- und 
eine Carboxyterminale Halfte spaltet. Wahrscheinlich 
stellt diese JCG-I-cDNA eine aberrant gespleifite 
Variante dar, da sich 5' und 3 1 Konsensus-SpleiSstellen 
and beiden Enden der Insertion finden. Insgesamt sind 
vier der funf derzeit bekannten humanen Mitglieder der 
SET-Proteinfamilie Anderungen unterworfen, die alle die 
SET-Dom&ne mutieren (HRX/ALL-1, EZH1/B52, SUV39H/MG-44 
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und KG-1) . Daruberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Trans lokationsbruchpunkt en oder instabilen 
chromosomalen Regionen kartiert (HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) . In Fig. 3 sind die aberranten 
Transkripte von humanen SET- Domane -Genen dargestellt. 
Links in der Figur ist die Lage der filnf derzeit 
bekannten SET - Domane - Gene auf dem jeweiligen Chromosom 
angegeben. U.a. sind die drei Gene (HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) , fur die aberrante cDNAs auf 
Translokationsbruchpunkten oder instabilen ', 
Chromatinregionen kartiert wurden, dargestellt. Vier 
der funf dargestellten SET-Domanen Gene weisen 
Mutationen auf, die alle die Carboxyterminale SET- 
Domane unterbrechen, welche in der Figur durch die 
dunkle Box dargestellt ist. Eine Translokation 
verbindet die aminoterminale Half te von HRX mit einer 
nicht korrelierten Gensequenz, die als gepunktete Box 
mit der Bezeichnung ENL dargestellt ist . . Mutationen und 
ein vorzeitiges Stopcodon verandern die SET-Domane von 
EZH1/B52. Punkt- und Frameshift -Mutationen unterbrechen 
die Chromo- und SET-Domane in MG-44. Eine groSe 
Insertion spaltet die SET-Domane von KG-1 in zwei 
Half ten. Aberrante Transkripte sind derzeit fur GSa. 
nicht bekannt. Das Cystein-reiche Cluster in B52 ist 
als gepunktete Box dargestellt; in HRX/ALL-1 sind die 
Homologieregion zu Methyltransf erasen als schraffierte 
Box und die A/T-Haken als vertikale Linien dargestellt. 
Die Namen der jeweiligen authentischen Gene sind rechts 
in der Figur angegeben. 

Die Tatsache, dafi ein Saugetiergen der SET- 
Proteinfamilie, HRX/ALL-1, mit translokations- 
induzierter Letikaraogenese ira Zusammenhang gebracht 
wurde (Tkachuk et all, 1992; Gu et al.,- 1992), ist ein 
starker Hinweis dafur, dafi Proteine mit der SET-Domane 
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nicht nur wichtige Regulatoren der Entwicklung sind, 
die chroma tinabhangige Veranderungen der Genexpression 
mitbestimmen, sondern daS sie, nach Mutation, auch die 
normale Zellprolif eration storen. 

Da alle bisher beschriebenen Mutationen die 
Primarstruktur der SET-Domane unterbrechen, liegt die 
Vermutung nahe, daS es die SET-Domane als solche ist, 
die eine entscheidende Rolle im Ubergang vom normalen 
zum transformierten Zustand spielt. Eine wichtige 
Funktion fur die SET-Domane kann ferner aufgrund ihrer 
evolutionaren Konservierung in Genprodukten, die von 
der Hefe bis zum Menschen auftreten, vermutet werden. 

Fig. 4 zeigt die evolutionare Konservierung von SET- 
Domane -Proteinen: Unter Verwendung des tf asta-Programms 
des Wisconsin GCG Netzwerkservice wurden Proteine und 
offene Leserahmen mit Homologie zur SET-Domane 
identif iziert . In der Figur ist eine representative 
Auswahl von Hefe bis zum Menschen gezeigt. Ziffern 
geben Aminosauren an. Die Carboxyterminale SET-Dom&ne 
ist durch eine schwarze Box dargestellt, Cys-reiche 
Regionen durch eine dunkel gepunktete Box, das GTP- 
Bindungsmotiv in Su(var)3-9 durch eine hellgepunktete 
Box und die Chromo-Domane von £u(var)3-9 und H3-9 durch 
eine offene Box mit hellen Punkten. Eine Region mit 
Homologie zu Methyltransf erase ( trx und HRX) ist als 
schraffierte Box dargestellt. A/T-"Haken" ("A/T Hooks") 
sind durch vertikale Linien dargestellt. Eine weitere 
Ser-reiche Region (S in C26E6.10) und eine Glu-reiche 
Region (E in G9a) oder Ankyrin-Repeats (ANK in G9a) 
sind ebenfalls hervorgehoben. YHR119 (GeneBank 
Accession No. U00059) und C26E6.10 (GeneBank Accession 
No. U13875) sind of f ene Leserahmen von kilrzlich in die 
Datenbank eingetragenen Cosmiden ohne eine funktionelle 
Charakterisierung. Prozente geben die Gesamtheit der 
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Aminosaure-Identitaten zwischen den humanen und den 
Drosqphila-Proteinen an. 

Fig. 5 zeigt die Ubereinstimmung an Aminosauren der 
SET-Domane. Die SET-Domane der in Fig. 4 dargestellten 
Gene wurde unter Verwendung des Pileup-Programms des 
Wisconsin GCG Netzwerkservice angeordnet. Fiir den 
Vergleich der KG- 1- SET-Domane wurde vor dem Pileup die 
grofie Aminosaure- Insertion, die die SET-Domane in zwei 
Half ten spaltet, entfernt. Aminosaure- Posit ionen, die 
8 von 10 Ubereinstimmungen aufweisen, sind 
hervorgehoben . 

Aufgrund der im Rahmen der vorliegenden Erf indung 
festgestellten Kriterien erweist sich eine Beteiligung 
der Gene, die eine SET-Domane haben, an der 
chromatinabhangigen Entstehung der deregulierten 
Proliferation; diese Gene bzw. die davon abgeleiteten 
cDNAs sowie Teil- und mutierte Sequenzen konnen somit 
bei der Therapie und Diagnose von Erkrankungen, die auf 
eine derartige Proliferation zuruckzufuhren sind, 
eingesetzt werden: 

Unterschiede im Transkriptionsniveau von SET-Domane- 
RNAs zwischen normalen und transformierten Zellen 
k6nnen als diagnostischer Parameter fur Erkrankungen 
herangezogen werden, in denen die Expression von SET- 
Dom&ne-Genen dereguliert ist: 

So k6nnen Oligonukleotide, kodierend fur die SET-Domane 
als solche bzw. Teilabschnitte davon, als 
diagnostischer Marker verwendet werden, urn bestirarate 
Krebsarten, in denen die SET-Domane mutiert ist, zu 
diagnostizieren. Fur die detaillierte Analyse der 
Funktion der erf indungsgemafien cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
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SET-Domane -Gensequenzen wurden irn Rahmen der 
vorliegenden Erfindung die homologen Maus-cDNAs von 
EZH1 {Ezhl) und SUV39H (Suv39h) isoliert. Bei 
Verwendung einer Maus-spezif ischen, fur die SET-Domane 
kodierenden, DNA-Sonde in "RNAse protection" Analysen 
zur Untersuchixng der Ezhl -Genaktivit St wahrend der 
normalen Mausentwicklung zeigte sich ein eher breites 
Expressionsprof il, das ahnlich dem von bmi (Haupt et 
al., 1991) ist. Die mit den Maussequenzen 
durchgefuhrten Analysen werden mit Humans equenz en 
ausgeweitet, urn die RNA-Mengen zwischen unreifen 
Vorlauf erzellen, Tumorzellen und dif f erenzierten Zellen 
in verschiedenen humanen Zellkultursystemen zu 
vergleichen. Um f estzustellen, ob sich die SET-Domane 
dementsprechend als diagnostischer Tumormarker fur 
spezifische Krebserkrankungen oder als genereller 
diagnostischer Parameter eignet, konnen gangige 
Methoden zur Bestimmung der RNA-Konzentration, die in 
einschlagigen Laborhandbuchern (Sambrook, J., Fritsch, 
E.F. und Maniatis, T., 1989, Cold Spring Harbor 
Laboratory Press) beschrieben sind, wie Northern Blot, 
SI -Nuclease -Protection-Analyse oder RNAse- Protection- 
Analyse, verwendet werden. 

Um die Haufigkeit zu untersuchen, mit der die SET- 
Domane spezifischen Mutationen unterliegt, konnen die 
SET-spezif ischen DNA-Sonden zur Analyse von 
Einzelstrang-Konf ormationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons et al., 1995) 
eingesetzt werden. 

Krebsarten, bei denen SET-spezif ische DNA-Sonden als 
diagnostischer Marker verwendet werden konnen, sind 
Brustkrebs (EZH1; Friedman et al., 1994), 
Synovialksarkom (SUV39H; Geraghty et al.; 1993) und 
Leukamien. 
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Aufgrund der Kenntnis der Nukleotidsequenz der SET- 
Domane-Gene konnen die entsprechenden von der cDNA- 
Sequenz abgeleiteten Proteine, die ebenfalls Gegenstand 
der vorliegenden Erf indung sind, in rekombinanter Form 
herstellt werden, indem die dafur kodierenden cDNAs in 
geeignete Vektoren inseriert und in Wirtsorganismen 
exprimiert werden. Die fur die Produktion rekombinanter 
Proteine verwendeten Techniken sind dem 
Durchschnittsf achmann gelaufig und konnen einschlagigen 
Handbuchera (Sambrook, J., Fritsch, E.F. und 
Maniatis, T., 1989, Cold Spring Harbor Laboratory 
Press) entnomraen werden. 

Gegenstand der vorliegenden Erf indung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molekiile, 
enthaltend die fur EZH2, SUV39H oder EZH1 kodierende 
DNA sowie damit funktionell verbundene 
Expressionskontrollsequenzen, sowie die damit 
trans formiert en Wirtsorganismen. 

Die erf indungsgemSfien rekotnbinanten Proteine k6nnen 
eingesetzt werden, um die Wechselwirk\ing von SET- 
DomcLne-Proteinen mit Chromatin bzw. mit anderen 
Mitgliedern von Heterochromatinkomplexen zu 
analysieren; ausgehend von den dabei erhaltenen 
Erkenntnissen uber die Wirkungsweise dieser Komplexe 
werden die sich im einzelnen ergebenden Mdglichkeiten 
fur das gezielte Eingreifen in die daran beteiligten 
Mechanismen definiert und k6nnen fUr therapeutische 
Anwendungen genutzt werden. 

Untersuchungen, die der weiteren Analyse der Funktion 
der SET-DoraSne dienen, werden z.B. durchgef <ihrt , indem 
cDNAs, kodierend fur humanes EZH2 bzw. SUV39H und 
versehen mit einem Epitop, gegen das Antik&rper zur 



WO 96/35784 



15 



PCT/EP96/01818 



Verfugung stehen, in vitro sowie in Gewebekulturen 
exprimiert werden. Nach Immunprazipitation mit den 
jeweiligen epitopspezif ischen Antikdrpern kann 
festgestellt werden, ob EZH2 und SUV39H miteinander 
in vitro wechselwirken konnen und ob in vivo eine 
Komplexbildung zwischen EZH2 und/oder SUV39H mit 
weiteren Chromatinregulatoren stattfindet. 

Es wurde bereits von anderen Autoren angenommen 
(DeCamillis et.al., 1992; Rastelli et al., 1993; 
Orlando und Paro, 1993) , daS eine Komplexbildung 
zwischen verschiedenen Mitgliedern von 
Heterochromatinproteinen wesentlich fur deren Funktion 
ist . Auf grund der Verf iigbarkeit der erf indungsgemaSen 
SET -Domane -Gene kann festgestellt werden, ob die SET- 
Region eine Domane darstellt, die auf grund von 
Wechselwirkungen funktioniert , oder ob sie zum 
Entstehen multirnerer heterochromatischer Komplexe 
beitragt. Ebenso kann festgestellt werden, ob die SET- 
Domane eine inhibitorische Funktion hat, Shnlich der 
amino terminalen BTB- Domane verschiedener 
Chromatinregulatoren, einschlieSlich des GAGA-Faktors 
(Adams et al., 1992), Insgesamt erlauben die Analy&en 
von Wechselwirkungen mit Epitop-versehenen EZH2- und 
StfV3SH-Proteinen eine weitere Charakterisierung der 
Funktion der SET-Domane. Dadurch werden Moglichkeiten 
eroffnet, gegen die deregulierte Aktivitat vorzugehen, 
indera z.B. mittels gentherapeutischer. Methoden . 
dominant -negative Varianten der SET-Domane-cDNA- 
Sequenzen.in die Zelle eingefiihrt werden. Derartige 
Varianten werden z.B. erhalten, indem zunachst die 
f unktionellen Domanen der SET-Proteine definiert 
werden, z.B. die fiir die DNA/Chromatin- oder die fxir 
die Protein/Protein-Wechselwirkung verantwort lichen 
Sequenzabschnitte, und indem dann die urn die 
jeweilige(n) Domane (n) oder urn Abschnitte davon 
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verkurzten DNA-Sequenzen in der betroffenen Zelle zur 
Expression gebracht werden, urn eine durch das intakte 
funktionelle Protein verursachte Deregulation der 
Proliferation zu kompetitieren. 

Die Verfiigbarkeit der erf indungsgemafien cDNAs erlaubt 
ferner die Herstellung transgener Tiere, z.B. Mause, in 
denen SET - Domane - Gene entweder uberexprimiert werden 
konnen ( "gain- of -function" ) oder in denen diese Gene 
ausgeschaltet werden konnen ( "loss-of-f unction" ) / fur 
letztere Analysen werden die korrespondierenden 
Tiersequenzen, insbesondere Maussequenzen, der 
erf indungsgemafien Gene eingesetzt. Diese Mause sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Insbesondere gibt die "gain-of -function 11 - Analyse, bei 
der Allele der erf indungsgemafien Gene in die Maus 
eingefuhrt werden, letztlich Aufschlufi uber die 
ursachliche Beteiligung von EZH2 und SUV39H an der 
chromatinabhangigen Forderung der Tumorentstehung. Fur 
die "gain-of -function" - Analyse konnen die kompletten 
cDNA-Sequenzen von humanem EZH2 und SUV39H sowie deren 
mutierte Versionen, wie EZH1/B52 und MG-44, mittels 
Vektoren, die hohe Expressionsraten ermSglichen, z.B. 
Plasmiden mit dem humanen fi-Actin-Promotor, getrieben 
sowohl vom Enhancer der schweren Kette von 
Immunglobulinen (E/x) als auch von Moloney- Virus - 
Enhancern (Mo-LTR) . Kurzlich wurde. gezeigt, dafi die-' 
E/i/Mo-LTR-abhangige Uberexpression des bmi-Gens, 
welches gemeinsam mit EZH2 zur Pc- Gruppe negativer 
Chromatinregulatoren zahlt, ausreicht in transgenen 
Mausen Lymphome zu erzeugen (Alkema et al., 1995) . 

Indem in "loss-of-f unction" -Analysen die endogenen 
Maus -Loci fur Ezhl und 3uv39h durch homologe 
Rekombination in etnbryonalen Staramzellen vmterbrochen 
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werden, kann bestimmt werden, ob der Verlust der 

in vivo-Genfunktion zu einer abnormalen Entwicklung der 

Maus fuhr.t. 

Aufgrund dieser in vivo-Systeme kann die Wirkung von 
EZH2 und SUV39H best&tigt werden; diese Systeme dienen 
aufierdem als Grundlage fur Tiermodelle im Hinblick auf 
eine humane Gentherapie. 

Der gentherapeutische Einsatz der erf indungsgemafien 
DNA-Sequenzen oder davon abgeleiteter Seguenzen (z.B. 
komplementarer Antisenseoligonukleotide) erfolgt - je 
nachdem, ob die zu behandelnde Erkrankung auf eine 
Deregulation von Chromatin infolge des Fehlens der 
funktionellen Gensequenz, oder aber infolge einer 
Uberexpression der entsprechenden Gene zuriickzuf uhren 
ist - durch Einfiihrung der funktionellen Gensequenz, 
durch Inhibierung der Genexpression, z.B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfuhrung einer 
fur eine dominant -negative Mutante kodierenden Sequenz. 
Die Einfuhrung der jeweiligen DNA-Sequenzen in die 
Zelle kann mit Hilfe von Standardmethoden fiir die 
Transfektion hdherer eukaryotischer Zellen erfolgeri, zu 
denen der Gentransfer mittels viraler Vektoren 
(Retrovirus, Adenovirus, Adeno-assoziiiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der 
Rezeptor-vermittelten Endozytose zahlen; Ubersichten 
uber gebrauchliche Methoden werden z.B. von Mitani und 
Caskey, 1993/ Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et al., 1993, 
WO 93/07283 gegeben. 

Fiir eine Inhibierung der Expression der 

erf indungsgemafien Gene kommen auch niedermolekulare 

Substanzen in Betracht, die in die 

Transkriptionsmaschinerie eingreifen; nach Analyse der 
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5 • -regulatorischen Region der Gene kann nach Substanzen 
gescreent werden, die die Wechselwirkung der jeweiligen 
Transkriptionsf aktoren mit dieser Region ganz oder 
teilweise blockieren, z.B. mit Hilfe der in der 
WO 92/13092 beschriebenen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechenden 
Antikorper gegen das EZH2- oder SUV39H- Protein, 
vorzugsweise humane oder humanisierte Antikdrper, 
therapeutisch eingesetzt werden. Die Herstellung 
solcher Antikorper erfolgt nach bekannten Methoden, wie 
sie z.B. von Malavsi und Albertini, 1992, oder von 
Rhein, 1993, beschrieben wurden. 

Antikorper gegen EZH2 oder SUV39H, die therapeutisch 
oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 
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Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezif ische cDNA- 
Bibliothek, wie von Bardwell und Treisman, 1994, 
beschrieben, hergestellt, indem Poly(A) + -RNA aus 
humanen BJA-B-Zellen isoliert, mittels Poly (dT) 3.5- 
Priming revers transkribiert und in doppelstrangige 
cDNA konvertiert wurde. Nach Zugabe eines EcoRI- 
Adapters der Sequenz 5' AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen gtlO 
ligiert. Die Propagierung und Amplif izierung der 
Bibliothek erfolgte in E.coli C600. 

b) Herstellung von DNA-Sonden 

Drosophila-DNA-Sonden, kodierend fdr die konservierten 
SET-Domanen von Elz) und Su(var}3-9, wurden auf der 
Grundlage der publizierten Drosophila-Sequenzen (Jones 
und Gelbart, 1993; Tschiersch et al., 1994) mittels 
Polymerasekettenreaktion (PGR) hergestellt: 1 fig von 
Droaophila melanogaster-DNA (Clontech) wurde mit den 
beiden Primern E{z) 1910 

( 5 1 ACTGAATTCGGCTGGGGCATCTTTCTTAAGG ) und E{z) 2280 
(5 1 ACTCTAGACAATTTCCATTTCACGCTCTATG) einer PCR- 
Amplifikation (35 Zyklen zu 3Q.sek.bei 94°C, 30 sek. bei 
55°C und 30 sek bei 72°C) unterworfen. Die 
entsprechende SET-Domane- Sonde fur Su(var)3-9 wurde von 
10 ng Plasmid-DNA (Tschiersch et al., 1994; Klon M4) 
mit dem Primerpaar suvar.up 

(5 ! ATATAGTACTTCAAGTCCATTCAAAAGAGG) und suvar.dn 
(5 1 CCAGGTACCGTTGGTGCTGTTTAAGACCG) amplif iziert , wobei 
dieselben Zyklusbedingungen verwendet wurden. Die 
erhaltenen SET - DomSne - DNA- Fragment e wurden Gel- 
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gereinigt und teilsequenziert , urn die Richtigkeit der 
amplif izierten Sequenzen zu bestatigen. 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque -bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 
Wirtsstammes E.coli C600 (bei einer optischen Dichte 

OD^oo von °- 5 ^ n 10 M 9 S0 4 suspendiert) bei 37°C 
15 min lang inkubiert und dann auf eine grofSe (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum ilber Nacht bei 37°C wurden die Phagen auf 
einer Nylonmembran (GeneScreen) absorbiert. Die Membran 
wurde, die Seite mit den absorbierten Phagen nach oben 
schauend, 30 sek lang in Denaturierungsldsung (1.5 M 
NaCl, 0.5 M NaOH) schwimmen gelassen, dann 60 sek in 
Denaturierungsldsung eingetaucht und abschlieSend 5 min 
lang in 3 M NaCl, 0.5 M Tris pH 8, neutralisiert . Damn 
wurde die Merabran kurz in 3xSSC gespult und die Phagen- 
DNA mittels DV-Vernetzung auf das Nylonfilter fixiert. 
Das Filter wurde 30 min lang bei 50 °C in 30 ml Church- 
Puffer (1 % BSA, 1 mM EDTA und 0.5 M NaHP0 4 , pH 7.2) 
prahybridisiert, anschliefiend wurden 2 x 10^ cpm der 
radioaktiv markierten DNA-Sondenmischung (E{z) -SET und 
Su(var) 3-9-SET) zugegeben; die DNA-Sonden wurden durch 
Random-priming unter Verwendung des RediPrime-Kit 
(Amersham) hergestellt. Die Hybridisierung wurde iiber 
Nacht bei 50°C durchgef olhrt . Nach Entfernung der : 
Hybridisierungslosung wurde das Filter 10 sek in 2xSSC, 
1 % SDS bei Raumtemperatur gewaschen, anschlieSend 
wurde 10 sek lang bei 50°C gewaschen. Das Filter wurde 
in Saranwrap gewickelt und unter Verwendung einer 
Verstarkerfolie der Autoradiographic unterworfen. 

Positive Phagenkolonien wurden auf der Originalplatte 
mittels Zuordnung des Autoradiograrams identif iziert und 
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die entsprechenden Agarstuckchen mit dem grofieren Ende 
einer Pasteur-Pipette entfernt. Der Phagen-Pool wurde 
liber Nacht bei 4°C in 1 ml SM-Puffer (5,8 g NaCl, 2 g 
MgS0 4 -H 2 0, 50 ml Tris pH 7.5, 5 ml 2 %ige Gelatine auf 
1 1 H2O) , enthaltend einige Tropfen CHCI3, eluiert. 
Das Phagenlysat wurde fiir eine zweite und dritte 
Screeningrunde wieder ausplattiert urn einzelne, gut 
isolierte positive Plaques (20 bis 100 Plaques pro 
Platte in der dritten Runde) zu erhalten. 

d) Sequenzanalyse 

Die cDNA- Inserts von rekombinanten Phagen wurden in den 
Polylinker von pBluescript KS (Stratagene) subkloniert 
und auf einem automatischen Sequenzer (Applied 
Biosystems) unter Verwendung der Didesoxy-Methode 
sequenziert. Die komplette Sequenz von wenigstens zwei 
unabhangigen Isolaten pro erhaltenen Gen wurde mittels 
"Primer walking" ermittelt. Die Sequenzen wurden mit 
dem GCG- Software- Pake t (University of Wisconsin) 
analysiert, die Untersuchung auf Homologie wurde mit 
dem "Blast and fasta" oder "tfasta" Netzwerkservice 
durchgef xihrt . Die kompletten Sequenzen von EZH2 und 
SUV39H sind in Fig. 6 und 7 dargestellt. 
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Patentanspruche 

1. DNA-Molekule, enthaltend eine fur ein 
Chromatinregulator-Protein, das eine SET-D6mane 
aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , daS 
sie die in Fig. 6, Fig. 7 oder Fig. 8 
dargestellte Nukleotidsequenz, kodierend fur 
EZH2, SUV39H oder EZH1, einschlieSlich ihrer 
degenerierten Varianten sowie Mutant en davon, 
enthalten. 

2. DNA-Molekul nach Anspruch 1, dadurch 
gekennzeichnet, daS es eine cDNA ist. 

3 . DNA-Molekiil nach Anspruch 1 oder 2 , dadurch 

gekennzeichnet, dafi es humanen Ursprungs ist. 

4. cDNA nach Anspruch 3 der Bezeichnung EZH2. 

5. cDNA nach Anspruch 3 der Bezeichnung SUV39H. 

6. DNA-Molekul nach Anspruch 4, dadurch 
gekennzeichnet, daS es die fur die SET-Dom&ne 
von EZH2 kodierende Region oder einen Abschnitt 
davon enthfilt. 

7. DNA-Molekill nach Anspruch 5, dadurch 
gekennzeichnet, da£ es die fur die SET-Domane 
SUV39H kodierende Region oder einen Abschnitt 
davon enthalt. 

8 . DNA-Molekul nach Anspruch 4 , dadurch da£ es fur 
eine dominant -negative Mutante von EZH2 kodiert. 
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9. DNA-Molekul nach Anspruch 4, dadurch dafi es fur 
eine dominant -negative Mutante von SUV39H 
kodiert . 

10. Rekombinantes DNA-Molekul, enthaltend eine in 
Anspruch 2 definierte cDNA, funktionell 
verbunden mit Expressionskontrollsequenzen, zur 
Expression in prokaryotischen oder 
eukaryotischen Wirtsorganismen. 

11. Prokaryotische oder eukaryotische 
Wirtsorganismen, trans formiert mit rekombinanter 
DNA nach Anspruch 10 . 

12 . Rekombinantes humanes Chromatinregulator-Protein 
EZH2 oder ein Abschnitt davon, erhaltlich durch 
Expression einer in Anspruch 4 definierten cDNA. 

13 . Rekombinantes humanes Chromatinregulator-Protein 

SUV39H oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA. 

14. Antikorper gegen EZH2. 

15 . Antikorper gegen SUV39H. 

16. Antisense (desoxy) ribonukleotide mit 
Komplementaritat zu einer Teilsequenz einer in 
Anspruch 1 definierten DNA. 

17. DNA-Molekul, kodierend fur die SET-Domane eines 
Chromatinregulator-Gens # bzw. fiir einen 
Abschnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine 
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Deregulation von Chromatinregulator-Genen, die 
eine SET-Domane aufweisen, zuruckzuf uhren sind. 

DNA-Molekul nach Anspruch 6 oder 7 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, zuruckzuf uhren sind. 

Antikorper nach Anspruch 14 oder 15 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromatinregulator-Genen; die eine SET-Domane 
aufweisen, zuruckzuf uhren sind. 

Transgene Maus, enthaltend ein Transgen fdr die 
Expression eines Chromatinregulator-Gens, das 
eine SET-Dom&ne aufweist, oder einer mutierten 
Version eines solchen Proteins. 

Knock-out Maus, erhaltlich aus erabryonalen 
Statnmzellen, in denen die endogenen Maus-Loci 
fur Ezhl und Suv39h durch homologe Rekombination 
unterbrochen wurden. 

Verfahren zum Identif izieren von Saugetier- 
Chroraatinregulator-Genen, die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, 
dadurch gekennzeichnet, daS man Saugetier-cDNA- 
oder genoraische DNA-Bibliotheken unter 
Bedingungen niedriger Stringenz tuit einem DNA- 
Molekul, kodierend fur die SET-Domane oder einen 
Abschnitt davon, hybridisiert . 
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Fig. 6/1 



EZH2 Lange: 2600bp (kodierend: 90 - 2330) 



1 AGGCAGTGGAGCCCCGGCGGCGGCGGCGGCGGCGCGCGGGGGCGACGCGCGGGAACAACG 60 . 

61 CGAGTCGGCGCGCGGGACGAAGAATAATCATGGGCCAGACTGGGAAGAAATCTGAGAAGG 120 

MGQTGKKS EKG 

121 GACCAGTTTGTTGGCGGAAGCGTGTAAAATCAGAGTACATGCGACTGAGACAGCTCAAGA 180 
PVCWRKRVKSEYMRLRQLKR 

• • • • • * 

181 GGTTCAGACGAGCTGATGAAGT AAAGAGT ATGTTTAGTTCCAATCGTCAGAAAATTTTGG 240 
FRRADEVKSMFSSNRQKILE 

• ••••• 

241 AAAGAACGGAAATCTTAAACCAAGAATGGAAACAGCGAAGGATACAGCCTGTGCACATCC 300 
RTEIL NQEWKQRRIQPVHI L 

• • • • • • 

301 TGACTTCTGTGAGCTCATTGCGCGGGACTAGGGAGTGTTCGGTGACCAGTGACTTGGATT 3 60 
TSVSSLRGTRECSVTSDLDF 

• • • • • 

361 TTCCAACACAAGTCATCCCATTAAAGACTCTGAATGCAGTTGCTTCAGTACCCATAATGT 420 
PTQVIPLKTLNAVASVPIMY 

421 ArTCTTGGTCTCCCCTACAGCAGAATTTTATGGTGGAAGATGAAACTGTTTTACATAACA 480 
SWSPLQQNFMVEDETVLHNI 

• **••♦ 

481 TTCCTTATATGGGAGATGAAGTTTTAGATCAGGATGGTACTTTCATTGAAGAACTAATAA 540 
PYMGDEVLDQDGTFIEELIK 

• * * • • • 

541 AAAATTATGATGGGAAAGTACACGGGGATAGAGAATGTGGGTTTATAAATGATGAAATTT 600 
NYDGKVHGDRECGFINDEIF 

601 TTGTGGAGTTGGTGAATGCCCTTGGTCAATATAATGATGATGACGATGATGATGATGGAG 660 
VE LVNALGQYNDDDDD DDGD 

661 ACGATCCTGAAGAAAGAGAAGAAAAGCAGAAAGATCTGGAGGATCACCGAGATGATAAAG 720 
DPEEREEKQRDLEDHRDDKE 

• ••••• 

721 AAAGCCGOCCACCTCGGAAATTTOCTTCTGATAAAATTTTTGAAGCCATTTCCTCJUITGT 780 
S RP PRKFP3DKIFEAI3SMF 

• »■••• 

781 TTCCAGATAAGGGCACAGCAGAAGAACTAAAGGAAAAATATAAAGAACTCACCGAAC^ 840 
PDKGTAEELREKYRELTEQQ 

• ••••• 

841 AGCTCCCAGGCGCACTTCCTCCTGJUVTGTACCCCCJUICATAGATGGACCAAATGC 900 
LPGALPP ECTPNIDGPNAKS 

90 1 CTGTTCAGAGAGAGCAAAGCTTAGACTOCTTTCATACGCTTTTCTGTAGGCGATGTTTTA 9 60 
VQREQSLHSFHTLFCRRCFK 

• ••••• 

961 AATATGACTGCTTCCTACATCCTTTTCATGCAACACCCAACACTTATAAGCGGAAGAACA 1020 
YDCFLHPFHATPNTYKRKNT 

1021 CAGAAACAGCTCTAGACAACAAACCTTGTGGACCACAGTGTTACCAGCAT 1080 
ETALDNKPCGPQCYQHLEGA 

• ••••• 

1081 GAAAGGAGTTTGCTGCTGCTCTCACCGCTGAGCGGATAAAGACCCCACCAAAACG 1140 
REFAAALTAERIKTPP RRPG 
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Fig. 6/2 



1141 GAGGCCGCAGAAGAGGACGGCTTCCCAATAACAGT AGCAGGCCCAGCACCCCCACCATTA 1200 
GRRRGRLP NNSSRPSTPTIN 

1201 ATGTGCTGGAATCAAAGGATACAGACAGTGATAGGGAAGCAGGGACTGAAACGGGGGGAG 1260 
VLESKDTDSDREAGTETGGE 
* 

1261 AGAACAATGATAAAGAAGAAGAAGAGAAGAAAGATGAAACTTCGAGCTCCTCTGAAGCAA 1320 
NNDKEEEEKKDETSSSS EAN 
• • » • • » 

1321 ATTCTCGGTGTCAAACACCAATAAAGATGAAGCCAAATATTGAACCTCCTGAGAATGrGG 1380 
SRCQTPIKMKPNIEPPENVE 

• • • • m • 

1381 AGTGGAGTGGTGCTGAAGCCTCAATGTTTAGAGTCCTCATTGGCACTTACTATGACAATT 1440 
WSGAE.ASMFRVLIGTYYDNF 

• • • • • • 

1441 TCTGTGCCATTGCTAGGTTAATTGGGACCAAAACATGTAGACAGGTGTATGAGTTTAGAG 1500 
CAIARLIGTKTCRQVYEFRV 

• • • • • • 

1501 TCAAAGAATCTAGCATCATAGCTCCAGCTCCCGCTGAGGATGTGGATACTCCTCCAAGGA 1560 
KESSI IAPAPAEDVDTPPRK 

• • • • » 

1561 AAAAGAAGAGGAAACACCGGTTGTGGGCTGCACACTG^ 1620 
KKRKHRLWAAHCRKIQLKKD 

• • • • • • 

1 62 1 ACGGCTCCTCTAACCATGTTTACAACTATCAACCCTGTGATCATCCACGGCAGCCTTGTG 168 0 
GSSNHVYNYQPCDHPRQPCD 

1681 ACAGTTCGTGCCC TT GTGTGAT AGCACAAAATT T TTGT GAAAAGT TT TGT CAATGTAGTT 1740 
SSCPCVIAQHFCEKFCQCSS 

• • • • • » 

1741 CJ&AGTGTGAAAACCGCTTTCCGGGATGCCGCTGCAAAGCACAGTGCA 1800 
ECQNRFPGCRCKAQCNTKQ'C 

• * • • • • 

1801 GCCCGTGCTACCTGGCTGTCCGAGAGTGTGACCCTGACCTCTGTCTTACTTGTGGAGCCG 1860 
P CYL AVRE CDPDLCL T C G A A 

• • • » • m 

1861 CTGACCATTGGGACAGTAAAAATGTGTCXTGCAAGAACTGCAG 1920 
DHWDSKNVSCKNC3IQRG3K 

• • • • • • 

1921 AAAAGCATCTATTGCTGGCACCATCTGACGTGGCAGGCTGGGGGATTTTTATCAAAGATC 1980 
KHLLLAPSDVAGWGIFIKDP 

• • • * • • 

1981 CTGTGCAGAAAAATGAATTCATCTCAGAATACTGTGGAGAGATTATTTC 2040 
VQKNEFISEYCGEIISQDEA 

• • • * • • 

2041 CTGACAGAAGAGGGAAAGTGTATGATAAATACATGTGCAGCTTTCTGTTCAACTTGAACA 2100 
DRRGKVYDKYMCSFLFNLNN 

• • • • • • 

2101 ATGATTTTGTGGTGGATGCAACCCGCAAGGGTAACAAAATTCGTTTTGCAAATCATTCGG 2160 
OFVVDATRKGMKIRFANHSV 

• • * • * • 

2161 TAAATCXAAACTGCTATGCAAAAGTTATGATGGTTAAC^ 2220 
NPNCYAKVMMVNGDHRIGIF 

• • • • • • 

2221 TTGCCAAGAGAGCCATCXAGACTGGCGAAGAGCTGTTTTTTG^ 2280 
AKRAI QTGEELFFDYRYSQA 
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2281 CTGATGCCCTGAAGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGACATCTGCTAC 2340 
DALKYVG IEREME I P * 

2341 CTCCTCCCCCTCCTCTGAAACAGCTGCCTTAGCTTCAGGAACCTCGAGTACTGTGGGCAA 2400 

2401 TTTAGAAAAAGAACATGCAGTTTGAAATTCTGAATTTGCAAAGTACTGTAAGAATAArTT 2460 

# 

2461 ATAGTAATGAGTTTAAAAATCJUICTTTTTATTGCCTTCTCJICCAGCTGCAAAGTGTTTTG 2520 
2 521 TACCAGTGAATTTTTGCJUITAATGCAGTATGGTACATTTTTCAACTTTGAATAAAGAATA 258 0 
2581 CTTGAACTTGTCAAAAAAAA 2600 
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Fig. 7/1 

SUV39H UJnge: 2732 bp (kodierend: 45 - 1284) 



* * * 9 4 

1 TCGCGAGGCCGGCTAGGCCCGAATGTCGTTAGCCGTGGGGAAAGATGGCGGAAAATTTAA 60 

M A E N L K 

• • • • • • 

61 AAGGCTGCAGCGTGTGTTGCAAGTCTTCTTGGAATCAGCTGCAGGACCTGTGCCGCCTGG 120 
GCSVCCKSSW NQLQDLCRLA 

... 
121 CCAAGCTCTCCTGCCCTGCCCTCGGTATCTCTAAGAGGAACCTCTATGACTTTGAAGTCG 180 
KLSCPALGISKRNLYDFEVE 
*•■•... 
181 AGT ACCTGTGCGATTAC AAGAAGATCCGCGAACAGGAATATT ACCTGGTGAAATGGCGTG 240 
YLCDY KKIREQEYYLVKWRG 

241 GATATCCAGACTCAG AGAGCACCTGGGAGCCACGGCAGAATCTCAAGTGTGTGCGTATCC 300 
YPDSESTWEPRQNLKCVRIL 

301 TCAAGCAGTTCCACAAGGACT TAGAAAGGGAGCTGCTCCGGCGGCACCACCGGTCAAAGA 360 
KQFHKDLERELLRRHHRSKT 
•••••• 

361 CCCCCCGGCACCTGGACCCAAGCTTGGCCAACTACCTGGTGCAGAAGGCCAAGCAGAGGC 420 
PRHLDPSLANYLVQKAKQRR 
* 

421 GGGCGCTCCGTCGCTGGGAGCAGGAGCTCAATGCCAAGCGCAGCCATCTGGGACGCATCA 480 
ALRRWEQELNAKRSHLGRIT 

481 CTGTAGAGAATGAGGTGGACCTGGACGGCCCTCCGCGGGCCTTCGTGTACATCAATGAGT 540 
VENEVDLDGPPRAFVYINEY 

• • • . • 

54 1 ACCGTGTTGGTGAGGGCATCACCCTCAACCAGGTGGCTGTGGGCTGCGAGTGCCAGGACT 600 
RVGEG ITLNQVAVGCECQDC 

• * ■ • • . 

€01 GTCTGTGGGCACCCACTGGAGGCTGCTGCCCGGGGGCGTCACTGCACAAGTTTGCCTACA 660 
L W A- P T G* G "C "C * P 'G " A S ITH~'ITF A Y N 

661 ATGACCAGGGCCAGGTGCGGCTTCGAGCCGGGCTGCCCATCTACGAGTGCAACTCCCGCT 720 
DQGQVRLRAGLPIYECNSRC 

• ••••• 

721 GCCGCTGCGGCTATGACTGCCCAAATCGTGTGGTACAGAAGGGTATCCGATATGACCTCT 780 
RCG Y D C P N R V V Q K *G I R Y D LC 

• ••••• 

781 GCATCTTCCGGACGGATGATGGGOGTGGCTGGGGCGTCCGCACCCTGGAGAAGATTCGCA 840 
1FRTDDGRG W G VRTLEKIRK 

841 AGAACAGCTTCGTCATGGAGTACGTGGGAGAGATCATTACCTCAGAGGAGGCAGAGCGGC 900 
NSFVMEYVGEIITSEEAERR 

• • • • • • 

901 GGGGCCAGATCTACGACCGTCAGGGCGCCACCTACCTCTTTGACCTGGACTACGTGGAGG 960 
GQI YDRQGATYLFDLDYVED 

• • • • • • 

961 ACGTGTACACCGTGGATGCCGCCTACTATGGCAACATCTCCCACTTTGTCAACCACAGTT 1020 
VYTVDAAYY GNISHFVNHSC 

• • • • • • 

1021 GTGAGCCCAACCTGCAGGTGTACAACGTCTTCATAGACJUU!CTTGACGA 1080 
DPNLQVYNVFI DNLDERLPR 

• • • • 

1081 GCATCGCTTTCTTTGCCACJUUjAACCATCCGGGCAGGCGAGGAGCT 1140 
IAFFATRTIRAGEELTFDYN 
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Fig. 7/2 



1141 ACATGCAAGTGGACCCCGTGGACATGGAGAGCACCCGCATGGACTCCAACTTTGGCCTGG 1200 
MQVDPVDMES TRMDSNFGLA 

1201 CTGGGCTCCCTGGCrCCCCTAAGAAGCGGGTCCGTATTGAATGCAAGTGTGGGACTGAGT 1260 
GLPGSPKKRVRI ECKCGTES 

1261 CCTGCCGCAAATACCTCTTCTAGCCCirAGAAGTCTGAGGCCAGACTGACTGAGGGGGCC 1320 
C R K Y L F * 

1321 TGAAGCTACATGGACCTCCCCCACTGC7GCCCTCCTGTCGAGAATGACTGCCAGGGCCTC 1380 

• • • • • • 

1381 GCCTGCCTCCACCTGCCCCCACCTGCTCCTACCTGCTCTACGTTCAGGGCTGTGGCCGTG 1440 

• • • • • • 

1441 GTGAGGACCGACTCCAGGAGTCCCCTTTCCCTGTCCC^ 1500 

• • • • • a 

1501 ACAAACCCCCACCCACCTTCAGAAATAGTTTTT 1560 
1561 TTCATGGCCTATTAAGGAGGTCCAAGGGGTGAGTCCCAACCCAGCCCCAGAATATATTTG 1620 

• • • ■ • a 

1621 TTTTTGCACCTGCTTCTGCCTGGAGATTGAGGGGTCTGCTGCAGGCCTCCTCCCTGCTGC 1680 

1681 CCCAAAGGTATGGGGAAGCAACCCCAGAGCAGGCAGACATCAGA 1740 

• ■ ■ • • • 

1741 CCGACATGAAGCTGGT TCCCCAACCACAGAAACTT TGTACTAGT GAAAGAAAGGGGTCCC 1800 

• • • • • • 

1801 TGGCCTACGGGCTGAGGCTGGTTTCTGCTCGTGCTTACAGTGCTGGGTAGTGTTGGCCCT 1860 

• ••••• 

1861 AAGAGCTGTAGGGTCTCTTCTTCAGGGCTGGATA7CTGAGAAGTG 1920 

» • • • • * 

1921 CTGGAAGGGAAGTGGGTGT CCATGGGCCACTGAGCAGTGAGAGGAAGGCAGTGCAGAGC7 1980 

• • • • • • 

1981 GGCCAGCCCTGGAGGTAGGCTGGGACCAAGCTCTGCCTTCACAGTGCAGTGAAGGTACCT 2040 

• • • • • • 

2041 AGGGCTCTTGGGAGCTC7GCGGTTGC7AGGGGCCCTGACCTGGGGTGTGATGACCGCTGA 2100 

2101 CACCACTCAGAGCTGGAACCAAGATCTAGATAGTCCGTAGA 2160 

2161 GTGCATTGATGGGGTGGTGATGAGGTGCCAGGCACTAGGTAGAGCACCTGCT 2220 

2221 ATTGTCTCAOSGAAGCC^TGAAAACXACC^AGGT 2280 

2281 AGAAGGCAAAGTACAGGCCAAGAATTGGGGGTGGGG 2340 

2341 GACGAGGCGAGAGGGAAGCCCTTGCTGCCTGCCATTCCCAGACCCCAGCCCT 2400 

• • • ■ • • 

2401 ACCCTGGTTCCACTGGTCTCAAAAGTCACCTGCCTACAAATGT 2460 

2461 TGATGGCTGCCTTGCTCOTGCTKCCCACCCCCTGTGAGGM 2520 
2521 CCTGACTACCTGTGCCOUSAGTGCCCCTACATGAGACTGTATGCCCT 2580 

2581 AGATCTATGTGTCTGTCTGTGTGTCCATCCCGCCGGCCCCCCAGACTAACCTCCAGGCAT 2640 

• • • • • • 

2641 GGACTGAATCTGG1TCTCCTC7TGTACACCCCTCAACCCT 2700 

2701 CAATAAAATGAACTGTCGACTGAAAAAAAAAA 2732 
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Fig. 8 



1844 TCTXACXXGXGGAGCCGCXGACCAXTGGGACAGXAAAAATGXGXCCXGCA 1893 
II N I I I I I III I I I M I I I I I I I II (I HIM I 
1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTXTCCTGTA 50 

1894 AGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCA 1943 
I IMIIMI II Mill II || Nil! II lllllli II 
51 AAAACXGCAGCAXCCAGCGXGGACXTAAGAAGCACCXGCTGCXGGCCCCC 100 



1944 TCTGACGTGGCAGTOTGGGGGATTTTi 1993 

uif r i \ -M^W^^i^fi vfei 1 >ri 1 1 m^M$ 

101 XCXGAXGXGGCCQ<&X^^ 150 



1994 
151 



. .... . — ^«;,2043 

mm 11 mi fWKijSiii ii: mmmrn- rrir i t:;iifeR^i|ll 

V.SAATTCATOTCt^g^^TO^ : 200 

2044 ACAGAAGAGKKjAfljffiTOT^ 2093 
I I I I I vmi |#t I f:l: N | |^.;f | l^v- 

201 AXCGACGCGGAAAGCTCXAX^ 250 



2094 XTGAACAAXGAraiTCT^ 2143 



251 CXCAAXAAXGAXX^GX^ 
2144 TXXXGOUUVTCATXCG^ 

1 1 i mf^ i iivN 

301 AXXXGCA^CAX$^GX<^ 

..■■..■•:■*. ...>_■».■.:-*■■-■ ;^^■:^■:•^N•:•:•:^^^:•:■:■^^A•:•:■:•:■:■^v^;^^r:..■/^f^^%*;•,;•.■•.^•.• • -■>*; , :•;<■:•;•'>•:-.*. _,;>;<<••'■ :; - :-x<v:w«£;x 

2192 GGXX AACTCXGAXCA^GGA 2241 



351 AGTAACCXGGGACTTGGGGTGGGGGATC^Tf^TCTTT^ 



2242 





&2291 



401 ^xtotxt^xg^gj^ 

2292 AAGXAXGXOGjGCM * 2 330 

451 &ATCAT(»raJUlTATCTTCTA^ 489 
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